聚类成员生成以及带约束的聚类融合选择研究

聚类成员生成以及带约束的聚类融合选择研究

作者:师大云端图书馆 时间:2020-06-25 分类:硕士论文 喜欢:2943
师大云端图书馆

【摘要】聚类融合首先生成一个包含多个不同聚类成员的聚类成员集,然后将其合并为一个更准确的共识分区。学者们普遍认为对于优质的聚类融合,其聚类成员应彼此不同,同时每个聚类成员的质量也应维持在一个可接受的水平。许多算法可用于生成不同的基聚类划分。与分类集成相似,诸多研究关注不同聚类成员的生成过程,例如对不同数据子集进行聚类(随机抽样)以及对不同特征子集进行聚类(随机投影)。然而,很少有研究关注这两种不同的抽样方法在质量和差异性上的性能比较。在本文中,我们提出了一种基于随机抽样的聚类成员生成新方法,通过寻找最近邻样本的方式来填补抽样时缺失样本的类别信息(简称为RS-NN)。我们通过与基于传统K-means的聚类融合方法、典型的随机投影方法(随机特征子集,简称为FS)以及另一种随机抽样方法(基于最近邻中心的随机抽样方法,简称RS-NC)进行对比来验证该方法的有效性。实验表明,FS总能取得更多样化的聚类成员集而RS-NC能取得较高的成员质量,我们提出的RS-NN方法则能在两者中合理地协调,在取得优异差异性的同时获得显著的性能提高。另外,为了追求更高的差异性,我们提出了一种基于RS-NN和FS的双随机抽样方法FS-RS-NN,该方法在保证一定质量的同时取得更高的差异性,并在不增加时间代价的前提下获得可比较的甚至更优的聚类融合效果。聚类融合已成为一个十分重要的数据分析工具,可以生成一个更强大更准确的共识聚类结果。现有研究表明,要得到较优的聚类融合结果,必须同时考虑聚类成员的质量和聚类成员之间的差异性。然而,很少有研究将其与先验背景知识结合起来。在本文中,我们首先对聚类成员的质量和差异性进行了简要的理论分析,然后提出了一个统一的框架来解决基于约束的聚类融合选择问题,其中样本之间的“必须连接”和“不能连接”约束作为给定的背景知识。我们将该问题转化为了一个联合优化问题,其中包含了基于给定约束的一致性、融合成员之间的差异性以及聚类成员的质量。该框架结合了两个决然不同却紧密相关的聚类主题:聚类融合和半监督聚类。我们研究了四种不同的聚类融合选择技术以追求高品质的聚类融合选择方案,实验充分说明了该框架的可行性和有效性。
【作者】李旋;
【导师】杨帆;
【作者基本信息】厦门大学,模式识别与智能系统,2013,硕士
【关键词】成员生成;融合选择;聚类融合;

【参考文献】
[1]刘小恺,刘茂松,黄峥,徐驰,张明娟,王汉杰.宁夏沙湖4种干旱区群落中主要植物种间关系的格局分析[J].植物生态学报,2009,02:320-330.
[2]孙远运,张骏温.基于数据仓库技术的铁路运输——智能决策支持系统总体框架的研究[A].中国科学技术协会.第六届全国计算机应用联合学术会议论文集[C].中国科学技术协会:,2002:4.
[3]陈小园.试论语文教师课堂教学的语言美[D].福建师范大学,教育,2003,硕士.
[4]何振国.开放知识披露下技术标准形成过程研究[D].河北师范大学,国际商务,2014,硕士.
[5]朱晓凯.副猪嗜血杆菌外膜蛋白双向电泳及间接ELISA方法建立[D].吉林农业大学,生物物理学,2012,硕士.
[6]陈少杰.智能消防中的控制及火源识别系统研究[D].华东交通大学,电机与电器,2013,硕士.
[7]刘丹丹.巨型艾美球虫免疫原性相异株间消减cDNA文库的构建及其差异表达基因分析[D].扬州大学,预防兽医学,2011,硕士.
[8]周军.学生权利问题之研究[D].华东师范大学,教育学原理,2001,硕士.
[9]高嵩.独立式光伏逆变电源的研究[D].北京交通大学,2008.
[10]魏祖雪,唐建国.多线性摄动多项式族的值域及其鲁棒稳定性[J].控制与决策,1998,04:82-85.
[11]黄维彬.国际引渡制度最新发展探析[D].河北经贸大学,国际法学,2012,硕士.
[12]杜娟娟.无线传感器网络中节点自定位与活动目标跟踪技术的研究[D].南京邮电大学,信号与信息处理,2013,硕士.
[13]李国忱.辽宁省清河流域生物完整性指数的研究[D].辽宁大学,生态学,2012,硕士.
[14]马陈,李钢,张仁斌,张慧君,秦亚军,谢昭.基于视觉概率统计的无监督数字抠图模型[J].计算机工程与应用.
[15]杨发.基于对话理论视阈下的大学生思想政治教育研究[D].复旦大学,思想政治教育,2012,硕士.
[16]郭飞舟.乔治·索罗斯金融投资思想研究[D].复旦大学,2005.
[17]刘慧梅,戈登·沃克.文化、自我建构与中国人的休闲[J].浙江大学学报(人文社会科学版),2014,04:146-158.
[18]张玲.初中生写作厌倦心理及对策研究[D].河北师范大学,学科教学,2014,硕士.
[19]管石琼.射频通信技术在家庭网关中的应用[D].宁波大学,集成电路工程(专业学位),2014,硕士.
[20]杨逢时,张琼,李国斌,苏毅.复合型导电高分子材料的研究进展[J].化工新型材料,2013,12:1-3.
[21]曹玉钧.极繁主义装饰风格在现代家具设计中的应用[D].北京林业大学,设计艺术学,2013,硕士.
[22]许伟.原料鲜度及发酵条件对香肠中亚硝酸盐和亚硝胺变化规律的影响[D].江南大学,农产品加工及贮藏工程,2012,硕士.
[23]曹盼.燕麦果汁复合饮料的研制[D].江南大学,粮食、油脂及植物蛋白工程,2012,硕士.
[24]王剑昆.阿拉善沙漠世界地质公园及泰山世界地质公园博物馆布展方案研究[D].中国地质大学(北京),地理学,2014,硕士.
[25]张国庆.质量经济效益理论和评价研究[D].大连理工大学,动力工程,2003,硕士.
[26]唐镇尧.EP/EMG系统设计及听觉诱发电位信号提取算法研究[D].广东工业大学,控制理论与控制工程,2013,硕士.
[27]杨国才.邺城地区和关中地区北朝晚期至隋墓葬形制若干问题研究[D].西北大学,考古学及博物馆学,2014,硕士.
[28]李琛.木质剩余物纤维多孔型材料制备及缓冲特性研究[D].东北林业大学,森林工程,2013,博士.
[29]刘振田,李维波,林城美,李卫超.一种改进的随机存储器自检测March算法[J].船电技术,2014,12:53-55.
[30]李乾坤.基于模板匹配的水表读数识别方法研究[D].华中师范大学,计算机系统结构,2014,硕士.
[31]束海波.收益差异对研发网络合作演化的影响研究[D].杭州电子科技大学,技术经济及管理,2014,硕士.
[32]高伟.锡基合金—石墨烯复合材料的合成及其在电池方面的应用[D].长春理工大学,2013.
[33]万耀梅.政治可持续发展视阈下的邓小平权力制约观[D].太原科技大学,马克思主义基本原理,2013,硕士.
[34]辛苹.基于结构方程模型的演艺业顾客满意度影响因素研究[D].中北大学,管理科学与工程,2014,硕士.
[35]王志远.单畴磁颗粒的磁矩动力学研究[D].苏州大学,光学,2014,硕士.
[36]张笑.现代工业产品设计中民族元素广窥[D].吉林大学,设计艺术学,2014,硕士.
[37]沈冠军.轻型图像制导多用途导弹总体技术研究[D].中北大学,火炮、自动武器与弹药工程,2013,硕士.
[38]高志南.新能源上市公司股权结构与成长性关系的实证研究[D].首都经济贸易大学,企业管理,2014,硕士.
[39]侯大为.“90后”大学生思想政治教育现状及对策研究[D].吉林农业大学,思想政治教育,2012,硕士.
[40]黄鹦.大跨度连续梁—钢桁架组合结构桥施工监控研究与实践[D].重庆大学,土木工程,2014,硕士.
[41]李尧.基于风险特征的我国商业银行效率评价[D].湖南大学,管理科学与工程,2012,硕士.
[42]马欣.自动入侵响应技术研究[D].西安电子科技大学,计算机应用技术,2004,硕士.
[43]夏琴晔.足球机器人全向视觉系统的自适应目标识别研究[D].广东工业大学,控制科学与工程,2013,硕士.
[44]叶玉杰.东北三省旅游竞争力评价研究[D].东北师范大学,旅游管理学,2012,硕士.
[45]赵明,王羽.开发动态的功能模拟预测方法及应用[J].石油地球物理勘探,2006,S1:130-132+150.
[46]戚洁.北京市近郊区土壤及农作物中砷累积特征[D].浙江大学,作物学,2012,硕士.
[47]张爽.不同诱导剂量的咪达唑仑对老年肺癌手术患者麻醉效果和苏醒质量的影响[D].吉林大学,临床医学,2014,硕士.
[48]陈杰.鸭部分繁殖性状杂种优势及其与相关基因表达关系的研究[D].扬州大学,动物营养与饲料科学,2011,硕士.
[49]孔意湘.电子商务伦理建设初探[D].湖南工业大学,伦理学,2012,硕士.
[50]洪少文.基于Android平台车辆检询系统的设计与实现[D].厦门大学,软件工程,2014,硕士.

相关推荐
更多